马斯克尬跳“科目三”,阿里云这款AI神器要火了吗?
作者|杨文
来源|AI先锋官
产品名称: 全民舞王
总体评价: ★★★★☆
易用性: ★★★★☆
功能性: ★★★★☆
创新性: ★★★☆☆
推荐功能: 图生视频
最近“科目三”火得一塌糊涂,由于其节奏明快、动作简单,使得大家一言不合就“斗舞”。
没想到,阿里也来凑热闹,在通义千问APP中推出了“全民舞王”,上传一张全身照就可生成一段“科目三”。
“全民舞王”具体玩法:
第一步:打开“通义千问”APP,在下方的对话框中输入“全民舞王”并搜索,即可进入“全民舞王”页面。
第二步:点击“立即体验热舞”,选择舞蹈模板。目前“全民舞王”提供了12种舞蹈模板,包括科目三、DJ慢摇、蒙古舞、鬼步舞等。
小编选择了最近火出国门的“科目三”,点击进入新页面,选择“舞同款”。
第三步:选择舞蹈形象。不同的舞蹈模板,系统均提供三种风格各异的舞蹈形象,例如科目三的舞蹈形象有娴静小悠、娇俏婉婉和丽人小颜。
用户还可以自定义舞蹈形象,只需要上传一张全身照即可。需要注意的是,上传的全身照一定要正面站立、全身无遮挡、无俯仰角。如果全身照是侧脸侧身、光线暗淡、手拿物品或者复杂背景都可能导致最终生成的效果不佳。
此外,选择的全身照最好不穿裙子,否则生成的视频较为诡异。
小编上传了一张《浴血黑帮》中基里安·墨菲的正面剧照。
第四步:点击“立即生成”,静待15分钟就可以得到一份热舞视频。由于等待时间较长,用户可以离开生成页面,热舞视频完成后会有系统通知。
以下是小编生成的热舞视频,酷帅的基里安·墨菲身穿英伦西装跳科目三,感觉有点搞笑。
整体来看,“全民舞王”生成的视频效果不错,舞蹈动作挺丝滑,但画面有些模糊,手部和脸部还是有较为明显的变形。
小编又上传了一张“硅谷钢铁侠”马斯克的全身照,让马斯克来尬跳一段“科目三”:
马斯克这跳得有模有样的,根本看不够啊,就是这脑袋跟P上去似的。
小编还整了几则视频,大家来看看效果:
据悉,“全民舞王”是基于阿里自研的AnimateAnyone而推出的图片生成舞蹈项目。
AnimateAnyone依托扩散模型提出了一种适合人物动画的新框架。为了保持外观一致性,阿里的研究者引入了 ReferenceNet,它被设计为对称的 UNet 结构,用于捕获参考图像的空间细节。
为了确保姿态可控性,该研究设计了一种轻量级姿态引导器,以有效地将姿态控制信号集成到去噪过程中。为了实现时间稳定性,研究者引入了时间层( temporal layer)来对多个帧之间的关系进行建模,从而在模拟连续且平滑的时间运动过程的同时保留视觉质量的高分辨率细节。
与以前的方法相比,AnimateAnyone具有以下几个优点:
1.它有效地保持了视频中人物外观的空间和时间一致性。
2.它生成的高清视频不会出现时间抖动或闪烁等问题。
3.它能够将任何角色图像动画化为视频,不受特定领域的限制。
总结:
从易用性上来说,“全民舞王”嵌入“通义千问”APP中,用户只需打开APP即可使用。而且,“全民舞王”几乎没有使用门槛,按照系统提示就能生成一段舞蹈视频。
从创新性和功能性上来说,图片转视频并不是什么新鲜事,Runway、Pika1.0、moonvalley等AI视频生成器均可完成。不过“全民舞王”算个轻量型的项目,用户只需一部手机、一张全身照,无需设置参数,即可生成舞蹈视频。生成的效果整体来看还不错,动作丝滑到位,就是画质较为模糊,此外,生成时间过长也是一大槽点。
2023年,AI圈子忙得热火朝天,但爆款应用却寥寥无几,阿里的妙鸭相机算一个。转眼到2024年,阿里再度发力,推出了“全民舞王”,它能成为继妙鸭相机之后的第二个AI爆款吗?
.END.
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
往期文章回顾